模态

多模态学习:让 LLM 对话系统 “能看会听”

传统 LLM 对话系统仅依赖文本交互,而多模态学习能融合文本、图像、语音、视频等多种信息,让对话突破 “纯文字” 限制 —— 比如用户发送一张 “猫咪呕吐” 的照片并提问 “它怎么了”,系统能结合图像特征与文本问题,给出更精准的宠物健康建议。这种技术让 LLM

模态 学习 llm 模态模型 llm对话 2025-09-10 03:04  7

国产多模态分子影像设备引领性突破,中国首创的“医学眼”助力精准诊疗|科研尖子生

在医学领域,有一种神奇的设备,如同给医生装上了 “透视眼”,能深入人体内部,发现那些常规影像无法发现的健康危机,它就是多模态分子影像设备。上海联影医疗科技股份有限公司(以下简称联影医疗)在这一领域取得了令人瞩目的成果,其研发的世界首台2米Total-body

模态 医学 影像 科研 尖子生 2025-09-09 17:58  11

AI 为何看不懂六指图?北京大学袁粒 x 华为专家万字对话,首期《高校有为》揭秘多模态大模型的那些事

2025 年,人工智能的发展已进入深水区。当我们习惯于 AI 在各个领域的出色表现时,一些看似微小却关键的“瑕疵”,成为了衡量其真实智能水平的试金石。其中一个典型案例,便是 AI 模型在面对一张有六根手指的手掌图片时,普遍会将其识别为“五根手指”。

模型 模态 北京大学 六指 高校有为 2025-09-08 20:10  6

四川大学华西医院神经外科成果|使用预处理MR图像预测脑膜瘤Ki-67的多模态深度学习模型

四川大学华西医院神经外科发表于《NPJ Precis Oncol》(中科院1区、IF=8.0分)的研究。研究针对脑膜瘤Ki-67指数预测的临床难题,提出了一种基于多模态深度学习模型的非侵入性解决方案。通过整合3D MRI、放射学特征与放射组学数据,该模型在内部

模态 华西医院 mr 四川大学华西医院 脑膜瘤 2025-09-08 19:03  6

方柚科技强势跻身 | 从 289 个到 14 个项目入围 2025 元宇宙 AI 数据要素 “金杏奖” 决赛

近日,2025 元宇宙 AI 数据要素 “金杏奖” 决赛进入冲刺阶段,14 个历经多轮筛选的优秀项目将在最终环节展开角逐。据赛事组委会披露,本届大赛自启动以来共收到 289 个项目申报,经程序审查后 260 个项目获得正式参赛资格,程序审查淘汰率约 10.03

模态 科技 孪生 tcg 易物 2025-09-08 11:15  12

AI产品经理之通过大模型做对话式分析产品

随着大模型技术的发展,对话式分析正引领一场效率革命,在各行业快速普及。未来,多模态技术将进一步重塑分析体验,成为企业数字化转型的标配能力。产品经理应把握这一趋势,避免技术崇拜,注重用户需求,为全员打造易用的数据洞察生产力工具。

模型 模态 产品经理 sql 闭源 2025-09-08 10:22  9

多模态大模型持续学习系列研究,综述+Benchmark+方法+Codebase一网打尽!

本系列工作核心作者: 郭海洋(自动化所博士生)、 朱飞 (中科院香港院AI中心AP)、 曾繁虎 (自动化所硕士生)、 刘文卓 (自动化所博士生)、 赵宏博 (自动化所博士生)。通讯作者为自动化所博士生导师张煦尧研究员和刘成林研究员。团队长期从事人工智能研究,成

模型 模态 研究 benchmark codebase 2025-09-08 10:25  7

每周AI信息参考:阿里首个超万亿参数模型上线

9月5日晚,阿里巴巴通义千问首个参数量超1万亿的大模型Qwen3-Max-Preview上线。阿里称其为通义千问系列中最强大的语言模型,在中英文理解、复杂指令遵循、工具调用等方面能力显著增强,大幅减少知识幻觉。在知识推理、数学推理、竞争性编程、复杂问题解决和人

模型 模态 llm 幻觉 虚拟人 2025-09-08 09:04  5

硬件多模态交互开发套件,客户产品交互频次70% | 创新场景

随着AI能力进步,越来越多的传统硬件厂商以及基于小模型AI能力构建的智能硬件厂商,迫切得需要升级到大模型以提升交互体验。然而,对于众多企业来说要想保障低延时交互的同时,又要确保模型的效果并且引入外部服务丰富AI能力,还要兼顾成本就变得尤为挑战。

模态 交互 阿里云 套件 模态交互 2025-09-08 09:04  11